@AudiovisualMaterial{Rodrigues:2020:DeLeHa,
abstract = "A {\'a}rea de sensoriamento remoto (SR) para
observa{\c{c}}{\~a}o da Terra tem experimentado um grande
desenvolvimento na {\'u}ltima d{\'e}cada. O acr{\'e}scimo
consider{\'a}vel do n{\'u}mero de sensores a{\'e}reos e
orbitais, assim como a evolu{\c{c}}{\~a}o tecnol{\'o}gica
empregada nesses equipamentos, causou um aumento expressivo do
volume de dados gerados, inaugurando um novo paradigma o Remote
Sensing Big Data (RSBD). Nesse contexto, uma das {\'a}reas de
maior desafio {\'e} a de sistemas de busca e
recupera{\c{c}}{\~a}o de imagens baseadas em conte{\'u}do
(Content-Based Image Retrieval CBIR). Tais sistemas empregam um
grande n{\'u}mero de descritores (vetor de atributos) de alta
dimens{\~a}o, onde a busca exaustiva {\'e} invi{\'a}vel devido
ao custo computacional. Para enfrentar esse problema duas
estrat{\'e}gias podem ser adotadas: i) melhorar os m{\'e}todos
de busca; ii) reduzir a dimens{\~a}o dos descritores de
atributos. Ultimamente, tem ganhado destaque na comunidade
cient{\'{\i}}fica m{\'e}todos de Hash profundo, ou seja,
m{\'e}todos que empregam redes neurais profundas para executar a
extra{\c{c}}{\~a}o de atributos de imagens e gera{\c{c}}{\~a}o
de c{\'o}digos bin{\'a}rios (Hash Codes) atrav{\'e}s de
aprendizagem simult{\^a}nea. Basicamente, durante o processo de
aprendizagem os m{\'e}todos mapeiam vetores de alta dimens{\~a}o
para um espa{\c{c}}o de atributos de baixa dimens{\~a}o
conhecido como Hamming Space, onde os atributos das imagens
s{\~a}o representados por Hash Codes que reduzem tanto
complexidade computacional da busca e recupera{\c{c}}{\~a}o
quanto o espa{\c{c}}o de mem{\'o}ria necess{\'a}rio para
representa{\c{c}}{\~a}o do conte{\'u}do das imagens, aumentando
assim a efici{\^e}ncia dessas tarefas. Nesse contexto, esse
trabalho apresenta uma abordagem para CBIR no escopo do RSBD
baseada na Metric-Learning based Deep Hashing Network (MiLaN). A
MiLaN emprega {\`a} Inception V3, rede convolucional profunda,
pr{\'e}-treinada com o conjunto de imagens ImageNet (benchmark de
Vis{\~a}o Computacional), o objetivo {\'e} obter um m{\'o}dulo
padr{\~a}o para extra{\c{c}}{\~a}o de atributos de imagens, que
s{\~a}o convertidos em Hash Codes para compor o espa{\c{c}}o de
atributos especializado para imagens de SR com base na
fun{\c{c}}{\~a}o Triplet Loss proposta para o ajuste da MiLaN. O
experimento foi conduzido sobre dois conjuntos de dados de SR: (i)
UC Merced Land Use Dataset (UCMD) - conjunto de ortoimagens
a{\'e}reas extra{\'{\i}}das da cole{\c{c}}{\~a}o de
mapeamento de {\'a}reas urbanas dos Estados Unidos; (ii) UCMD e
Landsat Center Pivot Images (LCPI) - criado a partir da
combina{\c{c}}{\~a}o do UCMD e amostras de imagens de {\'a}reas
com piv{\^o}s obtidas com o Landsat 8. Visando {\`a}
caracteriza{\c{c}}{\~a}o de {\'a}reas de interesse
cient{\'{\i}}fico como, por exemplo, agricultura, floresta ou
irrigadas por piv{\^o}s, foram realizadas buscas baseadas em
conte{\'u}do por meio do c{\'a}lculo de similaridade, utilizando
dist{\^a}ncia de Hamming, para recupera{\c{c}}{\~a}o de imagens
num conjunto de 2200 imagens, alcan{\c{c}}ando desempenho global
(mean Average Precision - mAP) de 91.40%, conseguindo efetivamente
recuperar imagens relevantes para as classes agricultura e
floresta e nem t{\~a}o relevantes para a classe piv{\^o}s.
Atrav{\'e}s do experimento realizado, foi poss{\'{\i}}vel
demonstrar o potencial dessa abordagem para o desenvolvimento de
sistemas CBIR que podem facilitar e viabilizar a busca por alvos,
a fim de suportar {\`a} pesquisa de grupos tem{\'a}ticos como,
por exemplo, SR para o monitoramento de {\'a}reas
agr{\'{\i}}colas ou irrigadas por piv{\^o}s.",
affiliation = "{Instituto Nacional de Pesquisas Espaciais (INPE)}",
author = "Rodrigues, Marcos Lima",
city = "S{\~a}o Jos{\'e} dos Campos",
conferencename = "Workshop dos Cursos de Computa{\c{c}}{\~a}o Aplicada do INPE, 20
(WORCAP)",
date = "8-11 e 14-17 set. 2020",
language = "pt",
note = "{(16 min)}",
publisher = "Instituto Nacional de Pesquisas Espaciais (INPE)",
publisheraddress = "S{\~a}o Jos{\'e} dos Campos",
ibi = "8JMKD3MGPDW34P/43HC4NE",
url = "http://urlib.net/ibi/8JMKD3MGPDW34P/43HC4NE",
targetfile = "Deep Learning e hashing para CBIR de imagens de sensoriamento
remoto - Marcos Lima Rodrigues.mp4",
title = "Deep learning e hashing para Content-Based Image Retrieval (CBIR)
de imagens de sensoriamento remoto",
type = "tecnologia da informa{\c{c}}{\~a}o",
year = "2020",
urlaccessdate = "19 maio 2024"
}